package top.jolyoulu.core.rdd.operator.transform

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

/**
 * @Author: JolyouLu
 * @Date: 2024/2/7 20:51
 * @Description
 */
object Spark013_RDD_Operator_Intersection {
  def main(args: Array[String]): Unit = {
    //准备环境 [*]:表示使用当前系统最大核
    val sparkConf: SparkConf = new SparkConf().setMaster("local[*]").setAppName("RDD")
    val sc: SparkContext = new SparkContext(sparkConf)

    val rdd1: RDD[Int] = sc.makeRDD(List(1, 2, 3, 4))
    val rdd2: RDD[Int] = sc.makeRDD(List(3, 4, 5, 6))
    //交集
    println(rdd1.intersection(rdd2).collect().mkString(","))
    //并集
    println(rdd1.union(rdd2).collect().mkString(","))
    //差集
    println(rdd1.subtract(rdd2).collect().mkString(","))
    //拉链，将相同位置数据关联一起
    println(rdd1.zip(rdd2).collect().mkString(","))
    //关闭环境
    sc.stop()
  }

}
